Zrównoważony rozwój jest koncepcją, która zakłada równoczesne uwzględnianie trzech kluczowych wymiarów: ekonomicznego, społecznego i środowiskowego, w celu zapewnienia dobrobytu obecnym i przyszłym pokoleniom. Idea ta zyskała na znaczeniu w obliczu rosnących wyzwań związanych z degradacją środowiska, nierównościami społecznymi oraz koniecznością utrzymania stabilnego wzrostu gospodarczego. Zrównoważony rozwój dąży do harmonijnego łączenia tych trzech sfer, tak aby postęp ekonomiczny nie odbywał się kosztem środowiska naturalnego i aby każdy człowiek miał równy dostęp do zasobów oraz usług publicznych, takich jak edukacja, opieka zdrowotna i godne warunki mieszkaniowe. Ze względu na zróżnicowanie gospodarcze, demograficzne i środowiskowe, województwa w Polsce różnią się znacznie pod względem poziomu rozwoju oraz występujących problemów. Dlatego analiza tych różnic, w kontekście zrównoważonego rozwoju, pozwala na bardziej precyzyjne określenie potrzeb rozwojowych oraz dostosowanie polityk regionalnych.
Celem opracowania jest porównanie poziomu zrównoważonego rozwoju w województwach Polski oraz sklasyfikowanie ich w ranking w oparciu o dwie metody porządkowania liniowego (bezwzorcową i wzorcową), a także dokonanie ich klasteryzacji w większe, podobne do siebie grupy. Okres badań to 2022 rok. Dane pochodzą z Banku Danych Lokalnych. Zachowując podstawową zasadę zrównoważonego rozwoju, czyli traktowanie wszystkich wymiarów równorzędnie, uznałam, iż do każdego z nich trzeba przyjąć taką samą liczbę zmiennych.
Na początku wyświetlę strukturę moich danych, aby uzyskać podstawowe
informacje o zestawie danych, którym będę się zajmować.
## tibble [16 × 16] (S3: tbl_df/tbl/data.frame)
## $ Nazwa: chr [1:16] "DOLNOŚLĄSKIE" "KUJAWSKO-POMORSKIE" "LUBELSKIE" "LUBUSKIE" ...
## $ X1 : num [1:16] 76748 56774 47611 56701 66393 ...
## $ X2 : num [1:16] 6945 5889 5910 6014 6211 ...
## $ X3 : num [1:16] 81765 52369 32603 59346 59361 ...
## $ X4 : num [1:16] 4.5 7.3 8 4.4 5.5 4.4 4.3 5.9 8.8 7 ...
## $ X5 : num [1:16] 11.86 8.48 8.55 9.47 8.87 ...
## $ X6 : num [1:16] 4.56 3.5 4.56 2.79 5.13 4.25 5.19 2.86 3.2 4.93 ...
## $ X7 : num [1:16] 31.3 30 31.5 30.1 34.1 27.1 28.9 30.7 27.8 29.4 ...
## $ X8 : num [1:16] 946 860 900 929 934 929 970 953 896 915 ...
## $ X9 : num [1:16] 31.7 28.3 31.3 30 32 31 33.3 31.8 29 32.2 ...
## $ X10 : num [1:16] 9 17.7 22.6 13.3 14.1 13.6 10.6 12.1 17.4 23.4 ...
## $ X11 : num [1:16] 0.07 0.1 0.04 0.04 0.08 0.07 0.05 0.11 0.05 0.02 ...
## $ X12 : num [1:16] 805 529 230 147 2240 ...
## $ X13 : num [1:16] 611 380 209 233 468 ...
## $ X14 : num [1:16] 18.6 31.8 22.7 39 19.6 ...
## $ X15 : num [1:16] 4.17 9.91 5.34 12.57 8.76 ...
Wszystkie zmienne diagnostyczne są numeryczne. Sprawdzę jeszcze
czy nie występują żadne braki w danych.
## /\ /\
## { `---' }
## { O O }
## ==> V <== No need for mice. This data set is completely observed.
## \ \|/ /
## `-----'
## Nazwa X1 X2 X3 X4 X5 X6 X7 X8 X9 X10 X11 X12 X13 X14 X15
## 16 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 0
## 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0
Braków w danych nie ma, więc teraz wyświetlę statystyki opisowe
zmiennych diagnostycznych.
| Minimum | Mediana | Maksimum | Skośność | Kurtoza | Średnia | Odchylenie standardowe | |
|---|---|---|---|---|---|---|---|
| X1 | 47611.00 | 57548.50 | 107711.00 | 1.63 | 5.72 | 62591.94 | 15271.08 |
| X2 | 5662.53 | 6076.93 | 7913.14 | 1.34 | 4.40 | 6286.70 | 595.12 |
| X3 | 32603.00 | 53150.50 | 108144.00 | 0.95 | 3.17 | 58555.62 | 20534.60 |
| X4 | 2.90 | 5.70 | 8.80 | 0.12 | 1.70 | 5.90 | 1.87 |
| X5 | 7.23 | 8.71 | 14.27 | 0.99 | 3.12 | 9.55 | 1.95 |
| X6 | 2.79 | 4.14 | 5.19 | -0.04 | 1.73 | 3.99 | 0.80 |
| X7 | 27.10 | 30.05 | 34.10 | 0.35 | 2.14 | 30.14 | 2.16 |
| X8 | 857.00 | 922.00 | 970.00 | -0.29 | 2.13 | 917.12 | 33.44 |
| X9 | 27.60 | 30.90 | 33.30 | -0.46 | 2.65 | 30.70 | 1.51 |
| X10 | 7.80 | 13.90 | 23.40 | 0.47 | 2.52 | 14.91 | 4.46 |
| X11 | 0.02 | 0.06 | 0.29 | 2.60 | 9.58 | 0.07 | 0.06 |
| X12 | 66.63 | 410.00 | 2636.04 | 1.24 | 3.30 | 754.91 | 800.87 |
| X13 | 170.09 | 375.02 | 1262.80 | 1.69 | 5.76 | 448.20 | 276.04 |
| X14 | 18.60 | 31.72 | 65.07 | 0.95 | 3.19 | 33.59 | 13.01 |
| X15 | 3.06 | 5.48 | 12.57 | 1.08 | 3.60 | 6.15 | 2.56 |
Przedstawię teraz rozkłady zmiennych diagnostycznych na
wykresach pudełkowych.
Jak widzimy, większość zmiennych diagnostycznych
charakteryzuje się prawostronną asymetrią oraz istnieją wartości
odstające (czerwone kropki). Aby osłabić to zjawisko, ograniczę wartości
zmiennych skrajnych do wartości dolnego lub górnego wąsa tj. odpowiednio
do wartości Q1-1,5* (Q3-Q1) oraz Q3+1,5* (Q3-Q1). Taki zabieg modyfikuje
wyjściowe dane, ale w kontekście budowania rankingu nie ma to większego
znaczenia. Ograniczenie odstających wartości można wyjaśnić tym, że
wpływ wartości pojedynczej cechy nie może wpływać w nieograniczonym
stopniu na poziom zrównoważonego rozwoju w województwach.
Teraz jeszcze raz wyświetlę wykresy pudełkowe i statystyki opisowe zmiennych diagnostycznych po usunięciu outlierów.
| Minimum | Mediana | Maksimum | Skośność | Kurtoza | Średnia | Odchylenie standardowe | |
|---|---|---|---|---|---|---|---|
| X1 | 47611.00 | 57548.50 | 94288.88 | 1.01 | 3.54 | 61753.05 | 12795.30 |
| X2 | 5662.53 | 6076.93 | 7904.80 | 1.34 | 4.36 | 6286.18 | 593.60 |
| X3 | 32603.00 | 53150.50 | 101538.88 | 0.78 | 2.67 | 58142.80 | 19512.17 |
| X4 | 2.90 | 5.70 | 8.80 | 0.12 | 1.70 | 5.90 | 1.87 |
| X5 | 7.23 | 8.71 | 14.27 | 0.99 | 3.12 | 9.55 | 1.95 |
| X6 | 2.79 | 4.14 | 5.19 | -0.04 | 1.73 | 3.99 | 0.80 |
| X7 | 27.10 | 30.05 | 34.10 | 0.35 | 2.14 | 30.14 | 2.16 |
| X8 | 857.00 | 922.00 | 970.00 | -0.29 | 2.13 | 917.12 | 33.44 |
| X9 | 28.30 | 30.90 | 33.30 | -0.12 | 2.40 | 30.80 | 1.32 |
| X10 | 7.80 | 13.90 | 23.40 | 0.47 | 2.52 | 14.91 | 4.46 |
| X11 | 0.02 | 0.06 | 0.15 | 0.87 | 3.12 | 0.07 | 0.04 |
| X12 | 66.63 | 410.00 | 2248.23 | 1.09 | 2.81 | 730.67 | 743.99 |
| X13 | 170.09 | 375.02 | 869.92 | 0.76 | 2.63 | 423.64 | 207.78 |
| X14 | 18.60 | 31.72 | 65.07 | 0.95 | 3.19 | 33.59 | 13.01 |
| X15 | 3.06 | 5.48 | 10.50 | 0.67 | 2.44 | 6.02 | 2.24 |
Jak moża zauważyć, dzięki modyfikacji kilku wartości pozbyłam się outlierów. Wartości przybliżają się do wartości Q1 i Q3, w rezultacie wąsy sięgają nowych, bardziej zewnętrznych wartości, które wcześniej były uważane za outliery.
Większość zmiennych wykazuje prawostronną skośność, co sugeruje, że w wielu województwach obserwowane są wartości poniżej średniej, z kilkoma wyjątkami osiągającymi znacznie wyższe wyniki. Zmienne takie jak PKB per capita, wynagrodzenia czy liczba nowych rejestracji wskazują na nierówności w rozwoju gospodarczym. Wysoka kurtoza w wielu przypadkach potwierdza koncentrację danych wokół mediany oraz intensywność wartości skrajnych, co może sugerować występowanie wyjątkowych przypadków w danym województwie.
Niektóre zmienne, takie jak liczba lekarzy oraz bezrobocie, wykazują
bliską zeru skośność, co sugeruje bardziej symetryczny rozkład i
równomierny dostęp do tych zasobów w różnych regionach. Z kolei zmienne
związane z ochroną środowiska, takie jak emisja gazów czy udział
obszarów chronionych, wskazują na duże zróżnicowanie, co może sugerować
różne polityki i podejścia do ochrony środowiska w różnych
województwach.
Biorąc pod uwagę wymiar ekonomiczny województwo mazowieckie wydaje się być najlepsze, natomiast najgorsze warmińsko-mazurskie.
Mieszkańcy województw: mazowieckiego, dolnośląskiego, śląskiego, małopolskiego i pomorskiego zarabiają przecietnie więcej, niż mieszkańcy innych województw.
Najmniej produkcji przemysłu ogółem na jednego mieszkańca, zostało sprzedane w województwach: warmińsko-mazurskim, świętokrzyskim i lubelskim.
Najciężej pracę jest znaleźć w województwie warmińsko-mazurskim i podkarpackim. Duże problemy mogą też napotkać mieszkańcy województwa zachodnio-pomorskiego, kujawsko-pomorskiego, świętokrzyskiego i podlaskiego.
Najmniej nowych jednostek gospodarczych w rejestrze REGON zostało
zarejestrowanych w województwie opolskim, a najwięcej w województwie
mazowieckim.
Najwięcej lekarzy jest dostępnych w województwie mazowieckim i łódzkim. Najmniej w województwie lubuskim, opolskim i warmińsko-mazurskim. Być może mieć na to realny wpływ dostępność uczelni wyższych i kierunków lekarskich w tych województwach.
Współczynik obciążenia demograficznego oznacza proporcję liczby osób w wieku poprodukcyjnym do liczby osób w wieku produkcyjnym. Najgorzej ta sytuacja kształtuje się w województwach: świętokrzyskim i łódzkim.
Północna część Polski charakteryzuje się tym, że mniejszy odsetek dzieci w wieku 3-5 lat uczęstsza do przedszkoli, odwrotna sytuacja ma miejsce w województwach południowo-zachodniej Polskii województwie mazowieckim.
Ubóstwo skrajne dotyka głównie północno-wschodnią Polskę,
natomiast w województwach: mazowieckim, dolnośląskim i śląskim
zagrożenie jest dużo niższe.
Najgrosza sytuacja środowiskowa związana z emisja zanieczyszczeń gazowych i pyłowych ma miejsce w województwach: śląskim i łódzkim. Wchodnia część Polski, charakteryzuje się lepszą jakością powietrza,
Najwięcej oczyszczalni ścieków zanjduje się w województwach: małopolskim, śląskim i mazowieckim - to te regiony mają najwyższy procent oczyszczonych ścieków komunalnych.
Najmniej obszarów prawnie chronionych jest w województwie zachodnio-pomorskim, dolnośląskim, śląskim i łódzkim. Województwo świętokrzystkie zajmuje pierwsze miejsce wśród wojwództw pod tym względem.
Najwięcej zasobów eksploatacyjnych wód podzielmnych znajduje się
w województwie lubuskm i kujawsko-pomorskim, a najmniej w województwie
podkarpackim i zachodnio-pomorskim.
Teraz przedstawię macierz korelacji pomiędzy zmiennymi diagnostycznymi i sprawdzę zależności zachodzące pomiędzy nimi.
Ten wykres wyraźnie pokazuje, że duża część zmiennych diagnostycznych
jest ze sobą skorelowana w stopniu wysokim.
Wysoka dodatnia korelacja sugeruje, że województwa z wyższym PKB per capita mają także wyższe przeciętne wynagrodzenie.
Bardzo silna dodatnia korelacja, co sugeruje, że województwa z wyższym PKB per capita mają również wyższą produkcję przemysłową na mieszkańca.
Wyższa produkcja przemysłowa jest powiązana z większą liczbą dzieci w przedszkolach.
Silna korelacja między tymi dwiema zmiennymi sugeruje, że województwa
z wyższą emisją gazów mają także wyższą emisję pyłków.
Wysoka ujemna korelacja z PKB per capita, wynagrodzeniem oraz produkcją sugeruje, że wyższe bezrobocie jest związane z niższym poziomem rozwoju gospodarczego.
Silna ujemna korelacja wskazuje, że wyższe zagrożenie ubóstwem występuje w województwach z niższym PKB i wynagrodzeniem.
Wysoka ujemna korelacja wskazuje, że wyższe bezrobocie jest związane z mniejszą liczbą dzieci w przedszkolach.
Każda kropka na wykresie reprezentuje jedno województwo Polski.
Łatwo dostrzec, że jedno z nich wyraźnie odróżnia się od reszty. Aby
odpowiedzieć na pytanie, które to województwo, przedstawię wyniki na
mapie województw.
Jak widzimy jest to województwo mazowieckie, które charakteryzuje się najwyższym PKB per capita oraz najwyższym średnim miesięcznym wynagrodzeniem. Na szczególną uwagę zasługuje tutaj województwo wielkopolskie, w którym mimo stosunkowo wysokiego PKB, średnie wynagrodzenia są niższe niż by tego oczekiwano. Teraz sprawdzę jak kształtuje się zależność pomiędzy PKB, a stopą bezrobocia rejestrowanego oraz liczbą nowych jednostek w REGON.
Cechy te, także wykazują dużą zależność między sobą. Wraz ze
wzrostem PKB, stopa bezrobocia rejestrowanego maleje, natomiast
jednostek nowo zarejestrowanych w rejestrze REGON przybywa. Popatrzmy
jak to się kształtuje w poszczególnych województwach.
Nawięcej nowych jednostek gospodarczych zakłada się w województwie
mazowieckim, duży przyrost notują także w województwa pomorskie,
dolnośląskie i małopolskie. Najmniej jednostek powstaje w województwie
śląskim.
Województwo podkarpackie i warmińsko-mazurskie charakteryzuje się
najwyższą stopą bezrobocia. Najlepiej sytuacja w kontekście niskiej
stopy bezrobocia wygląda w województwie wielkopolskim i śląskim.
Widzimy, że wraz z powstawaniem nowych jednostek
gospodarczych, wzrasta średnie miesięczne wynagrodzenie. Powstawanie
nowych firm prowadzi do większej konkurencji o pracowników. Firmy są
zmuszone oferować wyższe wynagrodzenia oraz lepsze warunki pracy, aby
przyciągnąć i zatrzymać pracowników. Jeżeli chodzi o stopę bezrobocia
możemy tutaj zauważyć odwrotny trend. Nowo powstające przedsiębiorstwa
generują popyt na pracowników, co prowadzi do tworzenia nowych miejsc
pracy. W miarę jak firmy się rozwijają, zatrudniają pracowników, co
bezpośrednio wpływa na zmniejszenie liczby osób zarejestrowanych jako
bezrobotne.
Podzieliłam województwa na trzy grupy według odsetka dzieci w
wieku 3-5 lat uczęszczających do przedszkoli. Można zauważyć, że wyższa
stopa bezrobocia jest skorelowana z mniejszym udziałem dzieci w
przedszkolach, co sugeruje, że w regionach o większym bezrobociu rodziny
są mniej skłonne do posyłania dzieci do placówek edukacyjnych. Zobaczmy,
które to województwa:
Województwa: warmińsko-mazurskie, podkarpackie i kujawsko-pomorskie,
które charakteryzują się wysoką stopą bezrobocia, wykazują niższy
odsetek dzieci uczęszczających do przedszkoli. Natomiast w
województwach, w których stopa bezrobocia jest niższa np. wielkoposlkie,
mazowieckie, duży odsetek dzieci chodzi do przedszkoli.
Nie wszystkie branże przemysłowe mają taki sam wpływ na jakość
powietrza. Przemysł lekki, technologiczny lub usługi mają znacznie
mniejszy wpływ na poziom zanieczyszczeń w porównaniu do przemysłu
ciężkiego. Taki przemysł charakteryzuje województwo wielkopolskie i
mazowieckie, w przeciwienstwie do województwa śląskiego, w którym
przemysł cięzki ma największy udział.
W metodach bezwzorcowych obliczenia polegają na uśrednieniu
wartości zmiennych unormowanych. Bazują na funkcji, której argumentami
są cechy opisujące obiekty.
Najpierw zamieniłam destymulanty (\(X_4\), \(X_7\), \(X_{10}\), \(X_{11}\), \(X_{12}\)) na stymulanty i dokonałam standaryzacji. Następnie zsumowałan uzyskane oszacowania według wzoru: \[s_i = \frac{1}{m} \sum_{j=1}^{m} \ z_{ij}\] Nie używałam wag, ponieważ uznałam, że każdy wymiar i każda zawarta zmienna jest tak samo ważna w kontekście badania zróżnicowania województw pod względem zrównoważonego rozwoju. Na końcu standaryzuje uzyskane wartości według wzoru: \[S_i = \frac{s_i - \min(s_i)}{\max[(s_i) - \min(s_i)]}\]
W metodach wzorcowych obliczenia polegają na wyznaczeniu
odległości poszczególnych obiektów od zdefiniowanego wzorca.
Najpierw zamieniłam destymulanty (\(X_4\), \(X_7\), \(X_{10}\), \(X_{11}\), \(X_{12}\)) na stymulanty i dokonałam standaryzacji. Utworzyłam wzorzec: \[ d_j^+ = \max_{i=1}^{n} z_{ij} \] Następnie obliczyłam odległość poszczególnych obiektów od wzorca: \[ d_i = \sqrt{\sum_{j=1}^{m} (x_{ij} - d_j^+)} \] Następnie wybrałam “dostatecznie” dużą odległość \(d_0\):
\[ d_0 = \bar{d_i} + 2 \cdot s(d_i) \]
A na końcu znalazłam wartość miary dla każdego obiektu: \[
S_i = 1 - \frac{d_{i_0}}{d_0}
\] W ten sposób otrzymałam tabelę z rankingiem województw polski
- od najlepszego do najgorszego, z rozdzieleniem na trzy wymiary
(ekonomiczny, społeczny i środowiskowy, brane pod uwagę przy badaniu
poziomu zrównoważonego rozwoju w województwach.
Analizując wymiar ekonomiczny, można stwierdzić, że zdecydowanie najlepsze pod tym względem było województwo mazowieckie, dolnośląskie, wielkopolskie (w metodzie bezwzorcowej) i pomorskie (w metodzie wzorcowej). Najsłabsze (w obydwóch metodach) było województwo warmińsko-mazurskie. Większość województw uzyskała te same miejsca w dwóch metodach porządkowania liniowego.
W przypadku wymiaru społecznego najsłabiej wypada województwo kujawsko-pomorskie (metoda standaryzowanych sum) i warmińsko-mazurskie (metoda Hellwiga). Jednoznacznie najkorzystniejsza sytuacja kształtuje się w województwie mazowieckim. Następnie w województwie dolnośląskim, małopolskim i wielkopolskim. Rankingi nie różnią się od siebie za bardzo - duża część województw uzyskała te same miejsca w obydwóch metodach.
Biorąc pod uwagę wymiar środowiskowy, uwidaczniają się znaczne różnice w stosunku do dwóch poprzednich wymiarów. Województwo warmińskomazurskie, które pod względem ekonomicznym i społecznym było najsłabsze, w wymiarze środowiskowym zajmuje wysokie miejsca w rankingu (odpowiednio 3 i 5). Najlepszym (w metodzie bezwzorcowej) okazało się województwo lubuskie, natomiast w metodzie wzorcowej województwo małopolskie. Ciekawym przypadkiem jest województwo śląskie i opolskie, które w wymiarze środowiskowym zajmują dwie skrajne lokaty (w zależności od wybranej metody porządkowania). W porównaniu do dwóch poprzednich wymiarów lokaty zajmowane przez województwa w rankingach różnią się w zależności od wybranej metody.
Analizując wszystkie trzy wymiary, ogólnie można stwierdzić, że województwo mazowieckie charakteryzowało się najkorzystniejszą sytuacją (4 na 6 razy zajęło pierwsze miejsce), a najmniej korzystną województwo warmińsko-mazurskie (3 na 6 razy zajęło ostatnie miejsce i raz przedostatnie).
Przedstawiłam charakterystyke najlepszego województwa (mazowieckie) oraz najgorszego (warmińsko-mazurskie) pod względem ekonomicznym. Łatwo zauważyć, że województwo warmińsko-mazurskie jest pod każdym względem dużo gorsze od województwa mazowieckiego.
Województwo mazowieckie - lider w klasyfikacji społecznej wyróżnia
szerszy dostęp do opieki medycznej oraz większe mieszkania. Natomiast w
województwie kujawsko-pomorskim, występuje wysoi wskaźnik zagrożenia
ubóstwem.
Województwo małopolskie charakteryzuje duży udział obszarów
chronionych, natomiast województwo śląskie, które zajęło ostatnie
miejsce w tym rankingu niestety zmaga się z dużą emisją zanieczyszceń.
Następnie na podstawie wybranych zmiennych obliczyłam poziom zrównoważonego rozwoju dla wszystkich województw. Im wyższe wartości, tym wyższy poziom zrównoważonego rozwoju.
Rankingi są do siebie zbliżone, częstą jest sytuacja, że dane województwo zajmuje to samo miejsce w obydwóch rankingach. W ogólnej klasyfikacji województwo mazowieckie uzyskało najwyższe lokaty w obydwóch rankingach. Za najsłabsze można uznać województwo warmińsko-mazurskie (które uzyskało raz ostatnie miejsce i raz przedostatnie) oraz województwo świętokrzyskie (w metodzie Hellwiga).
Największa różnica w pozycjach między rankingami to 3 miejsca (województwo świętokrzyskie).
Województwa: dolnośląskie, kujawsko-pomorskie, lubelskie, lubuskie, łódzkie, małopolskie, mazowieckie i śląskie otrzymały takie same lokaty w rankingach.
Dla każdej z metod obliczyłam średnią wartość wskaźnika dla wszystkich województw. W obydwóch metodach ponad średnią wartością znajdowało się 7 województw – w każdym przypadku były to te same województwa. Można je uznać za te, które mają najwyższy poziom rozwoju. Były to: dolnośląskie, lubuskie, małopolskie, mazowieckie, pomorskie, śląskie i wielkopolskie.
Teraz przedstawię na wykresie radarowym najlepsze i
najgorsze województwo:
Jak widzimy, obydwa województwa są na podobnym poziomie, jeżeli
chodzi o wymiar środowiskowy. Jednak w idei zrównoważonego rozwoju,
wszytskie trzy wymiary muszą być jak najwyższe, z tego właśnie powodu
województwo mazowieckie, które dwa pozostałe wymiary ma na wysokim
poziomie, prowadzi w ogólnym rankingu zróżnicowania poziomu
zrównoważonego rozwoju wśród województw Polski.
W celu dokładniejszego zaobserwowania przestrzennego zróżnicowania poziomu zrównoważonego rozwoju w Polsce, zgodnie z zasadą jednego odchylenia od średniej, ze względu na wartość zmiennej syntetycznej dokonałam podziału województw na cztery grupy:
grupa I - województwa o największym poziomie zrównoważonego rozwoju, dla których wartość miary wskaźnika spełnia warunek: \[ r > \overline{x} + S_{x} \]
grupa II - województwa o ponadprzeciętnym poziomie zrównoważonego rozwoju, dla których wartość miary wskaźnika spełnia warunek: \[ r \in \left(\overline{x}, \overline{x} + S_{x}\right] \]
grupa III - województwa o przeciętnym poziomie zrównoważonego rozwoju, dla których wartość miary wskaźnika spełnia warunek: \[ r \in \left(\overline{x} - S_{x}, \overline{x}\right] \]
grupa IV - województwa o nikim poziomie zrównoważonego
rozwoju, dla których wartość miary wskaźnika spełnia warunek: \[
r \leq \overline{x} - S_{x}
\]
Gdzie:
\({\overline{x}}\)- średnia wartości rozważanego wskaźnika
\(S_{x}\) - odchylenie standardowe wartości rozważanego wskaźnika
Poniższe wykresy przedstawiają zróżnicowanie przestrzenne
województw Polski ze względu na poziom zrównoważonego rozwoju.
Rankingi są do siebie bardzo zbliżone, większość województw należy do tych samych grup w obydwóch rankingach. Różnica polega na tym, że województwa: lubelskie i podkarpackie w metodzie standaryzowanych sum są w grupie wyżej, niż w metodzie Hellwiga. Natomiast województwo świętokrzystkie w metodzie Hellwiga plasuje się w grupie wyżej, niż w drugiej metodzie.
Na koniec oszacuję współczynnik korelacji tau Kendalla, który opisuje związek między rankingami wyznaczonymi na podstawie metod standaryzowanych sum i Hellwiga.
Korelacja pomiędzy metodami wynosi 0,908. Jest to bardzo silna
dodatnia zależność, co pokazuje, że obydwiema metodami uzyskałam
zbliżone do siebie wyniki. Taki wynik sugeruje, że obie metody są spójne
w swojej ocenie analizowanych danych.
Poziom zrównoważonego rozwoju na podstawie przeprowadzonej analizy wykazuje znaczne zróżnicowanie. Bazując na wykonanych obliczeniach, można stwierdzić, że: - W wymiarze ekonomicznym i społecznym najkorzystniej wypadło województwo mazowieckie, a najsłabiej warmińsko-mazurskie. - Pod względem środowiskowym najwyższymi pozycjami charakteryzowało się województwo lubuskie i małopolskie, a najniższymi – opolskie i śląskie. - Na podstawie rankingów województw uwzględniających łącznie wszystkie wymiary najlepsze było województwo mazowieckie, a najsłabsze warmińsko–mazurskie oraz świętokrzyskie. - Oprócz województwa mazowieckiego wysokim poziomem rozwoju wyróżniały się województwa: dolnośląskie, małopolskie, pomorskie i wielkopolskie. - Rankingi otrzymane dwoma różnymi metodami (bezwzorcowąi wzorcową) są do siebie bardzo zbliżone, co potwierdza silna dodania korelacja tau Kendalla.
W wybraniu odpowiedniej ilości klastrów pomogą mi różne metody i indeksy, które służą do identyfikacji optymalnej liczy klastrów.
Jedną z nich jest metoda łokcia, która polega na tym, aby łączna suma wariancji w poszczególnych grupach była jak najmniejsza. Czym mniejsza ta wariancja tym grupy będą zawierały bardziej zbliżone obserwacje.
W tym wykresie na osi poziomej umieszcza się liczbę grup (klastrów), a na pionowej sumę kwadratów odległości poszczególnych obserwacji od centroidów. Wybiera się liczbę grup, przy której jest widoczne znaczne załamanie spadku sumy kwadratów – dodanie kolejnej grupy nie przynosi już aż tak dużych korzyści.
Patrząc na wykres cięzko jednoznacznie określić punkt, od którego
wariancja już nie zmienia się aż tak bardzo, liczyłam na to, że na
wykresie będzie widoczne silne zagięcie tzw. “łokieć”, który
jednoznacznie określi najlepszą ilość klastrów. Wydaje mi się, że w
okolicach 4-6 grup wariancja przestaje spadać już dosyć widocznie, spada
o kilka jednostek, a wykres zaczyna się wypłaszcać, więc okolice tych
grup wydają sie być korzystne. Aczkolwiek, nie uzyskałam zbytnio
konkretnych odpowiedzi na pytanie jaka ilość klastrów jest odpowiednia,
dlatego skorzystam z kolejnej metody.
Silhouette nazywany jest miarą wewnętrzną, ponieważ wykorzystuje w swej ocenie średnią odległość pomiędzy obserwacjami wewnątrz grupy (a) i średnią odległość obserwacji do najbliższej „obcej” grupy (b). Poniżej wzór:
\[ \frac{1}{n} \sum_{i=1}^{n} s(i) \]
\[
s(i) = \frac{b(i) - a(i)}{\max\{a(i), b(i)\}}
\]
gdzie: \(a(i)\) oznacza
średnią odległość punktu do innych punktów znajdującym się w tym samym
klastrze (naturalnie oczekuje się jak najmniejszej wartości, żeby
klastry zawierały jak najbardziej zbliżone obserwacje)
\(b(i)\) jest średnią odległościa od
punktów znajdujących się w innym klastrze, ale bedącym najbliżej (tutaj
natomiast oczekujemy jak największej wartości, co będzie oznaczać ze
obserwacja jest daleko od innych klastrów)
Zobaczę jak wygląda to
na wykresie:
Indeks ten wskazał, że podzielenie danych na dwie grupy jest najlepsze, osiągając maksymalną wartość. Jednak wartości dla czterech, pięciu i sześciu klastrów również pozostają na wysokim poziomie, co sugeruje zbieżność wyników z metodą łokcia.
Jest to kolejny indeks służący do optymalnego wyboru liczby klastrów w analizie skupień. Optymalną liczbą klastrów jest ta, dla której wartość tego wskaźnika osiąga maksimum. Poniżej przedstawiam wzór:
\[ CH = \frac{\frac{BCSS}{k-1}}{\frac{WCSS}{n-k}} \] Gdzie: BCSS – suma kwadratów odległości między klastrami, WCSS – suma kwadratów odległości wewnątrz klastrów, k – liczba klastrów, n – liczba punktów w zbiorze danych.
Zobaczę jak wygląda to na wykresie:
Indeks Calińskiego Harabasza osiąga najwyższą wartość dla dwóch
klastrów. Wartości tego indeksu dla trzech, czterech i pięciu klastrów
również pozostają na relatywnie wysokim poziomie w porównaniu z innymi
rozważanymi liczbami klastrów.
Podział województw Polski na dwie grupy w kontekście poziomu
zrównoważonego rozwoju jest, moim zdaniem, niewystarczający.
Zrównoważony rozwój to złożone zagadnienie, obejmujące aspekty
ekonomiczne, społeczne i środowiskowe. Redukcja tego tematu do tylko
dwóch kategorii może prowadzić do uproszczeń i zniekształceń. Indeksy
wskazują, że optymalnym wyborem byłoby podzielenie województw na 4-6
grup. W związku z tym zdecydowałam się na podział na 4 grupy.
| Minimum | 1 kwartyl | Mediana | 3 kwartyl | Maksimum | Średnia | Odchylenie standardowe | |
|---|---|---|---|---|---|---|---|
| X1 | -1.11 | -0.87 | -0.33 | 0.50 | 2.54 | 0 | 1 |
| X2 | -1.05 | -0.64 | -0.35 | 0.70 | 2.73 | 0 | 1 |
| X3 | -1.31 | -0.74 | -0.26 | 0.44 | 2.22 | 0 | 1 |
| X4 | -1.55 | -0.82 | 0.11 | 0.80 | 1.61 | 0 | 1 |
| X5 | -1.19 | -0.72 | -0.43 | 0.57 | 2.42 | 0 | 1 |
| X6 | -1.50 | -0.70 | 0.19 | 0.72 | 1.50 | 0 | 1 |
| X7 | -1.83 | -0.65 | 0.04 | 0.84 | 1.41 | 0 | 1 |
| X8 | -1.80 | -0.65 | 0.15 | 0.89 | 1.58 | 0 | 1 |
| X9 | -1.89 | -0.55 | 0.07 | 0.70 | 1.89 | 0 | 1 |
| X10 | -1.90 | -0.57 | 0.23 | 0.43 | 1.60 | 0 | 1 |
| X11 | -2.41 | -0.55 | 0.30 | 0.73 | 1.30 | 0 | 1 |
| X12 | -2.04 | -0.40 | 0.43 | 0.70 | 0.89 | 0 | 1 |
| X13 | -1.22 | -0.67 | -0.23 | 0.46 | 2.15 | 0 | 1 |
| X14 | -1.15 | -0.85 | -0.14 | 0.53 | 2.42 | 0 | 1 |
| X15 | -1.32 | -0.64 | -0.24 | 0.41 | 2.00 | 0 | 1 |
Jak widzimy, po standaryzacji nie ma obiektów, które mają wartości na moduł większe od 3. Tak jak już sprawdzałam w pierwszej części projektu, korelacja pomiędzy zmiennymi wynosi |r|< 0.9 oraz współczynnik zmienności jest większy niż 10%, a więc wszystkie założenia są spełnione.
Teraz podzielę moje dane na 4 grupy - zgodnie z tym co wcześniej
ustaliłam sprawdzając kolejne indeksy. Poniżej cztery grupy województw
wraz z zestandaryzowanymi wartościami poszczególnych zmiennych:
| Wojewodztwo | X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 | X15 | Klaster |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| DOLNOŚLĄSKIE | 1.172 | 1.110 | 1.211 | 0.750 | 1.185 | 0.716 | -0.534 | 0.863 | 0.677 | 1.326 | -0.125 | -0.099 | 0.904 | -1.151 | -0.822 | 1 |
| MAZOWIECKIE | 2.543 | 2.727 | 2.224 | 0.857 | 2.420 | 1.503 | 0.575 | 1.581 | 1.886 | 0.967 | 0.446 | -0.278 | 1.033 | -0.300 | 0.274 | 1 |
| Wojewodztwo | X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 | X15 | Klaster |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| KUJAWSKO-POMORSKIE | -0.389 | -0.670 | -0.296 | -0.750 | -0.548 | -0.608 | 0.066 | -1.708 | -1.890 | -0.625 | -0.982 | 0.271 | -0.211 | -0.138 | 1.733 | 2 |
| LUBELSKIE | -1.105 | -0.634 | -1.309 | -1.125 | -0.512 | 0.716 | -0.627 | -0.512 | 0.375 | -1.724 | 0.732 | 0.672 | -1.034 | -0.837 | -0.303 | 2 |
| PODKARPACKIE | -1.032 | -1.051 | -0.806 | -1.554 | -0.841 | -0.983 | 1.083 | -0.632 | -1.362 | -0.558 | 0.446 | 0.841 | -0.257 | 0.867 | -1.317 | 2 |
| PODLASKIE | -0.869 | -0.460 | -0.724 | -0.589 | -0.574 | 1.178 | 0.344 | -0.064 | 1.055 | -1.904 | 1.303 | 0.854 | -1.220 | -0.125 | -1.146 | 2 |
| ŚWIĘTOKRZYSKIE | -0.871 | -0.848 | -0.873 | -1.018 | -0.835 | -0.533 | -1.735 | -0.721 | -0.455 | 0.025 | -0.982 | -0.748 | -0.584 | 2.419 | -0.584 | 2 |
| WARMIŃSKO-MAZURSKIE | -0.989 | -1.030 | -1.078 | -1.447 | -0.887 | -1.233 | 0.759 | -1.798 | -1.173 | -1.276 | 1.017 | 0.893 | -1.098 | 1.010 | 0.123 | 2 |
| ZACHODNIOPOMORSKIE | -0.268 | -0.196 | -0.624 | -0.429 | 0.528 | 0.054 | -0.719 | -0.512 | -0.455 | 0.317 | 0.161 | 0.634 | -0.574 | -0.923 | -1.043 | 2 |
| Wojewodztwo | X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 | X15 | Klaster |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| ŁÓDZKIE | 0.363 | -0.127 | 0.062 | 0.214 | -0.348 | 1.428 | -1.828 | 0.505 | 0.904 | 0.182 | -0.411 | -2.029 | 0.211 | -1.072 | 1.223 | 3 |
| OPOLSKIE | -0.396 | -0.256 | -0.216 | 0.000 | -1.189 | -1.408 | -0.257 | 1.073 | 0.753 | 0.631 | -1.267 | -1.237 | -0.372 | -0.489 | -0.176 | 3 |
| ŚLĄSKIE | 0.769 | 0.744 | 1.412 | 1.179 | -0.682 | 0.454 | -0.811 | 1.013 | -0.002 | 1.595 | -2.409 | -2.040 | 2.148 | -0.876 | 0.830 | 3 |
| Wojewodztwo | X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 | X15 | Klaster |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| LUBUSKIE | -0.395 | -0.458 | 0.062 | 0.804 | -0.041 | -1.495 | 0.020 | 0.355 | -0.607 | 0.362 | 0.732 | 0.785 | -0.916 | 0.413 | 1.999 | 4 |
| MAŁOPOLSKIE | 0.090 | 0.907 | -0.330 | 0.804 | 0.713 | 0.329 | 1.406 | 0.355 | 0.149 | 0.294 | -0.125 | 0.355 | 1.685 | 1.422 | -0.532 | 4 |
| POMORSKIE | 0.404 | 0.692 | 0.243 | 0.697 | 1.339 | 0.491 | 1.129 | -0.751 | -0.531 | 0.272 | 1.017 | 0.507 | 0.311 | -0.070 | 0.131 | 4 |
| WIELKOPOLSKIE | 0.975 | -0.449 | 1.041 | 1.608 | 0.272 | -0.608 | 1.129 | 0.953 | 0.677 | 0.115 | 0.446 | 0.620 | -0.026 | -0.149 | -0.389 | 4 |
Jak widzimy, województwa Polski zostały podzielone na 4 grupy:
I grupa: dolnośląskie i mazowieckie
II grupa: kujawsko-pomorskie, lubelskie, podkarpackie, podlaskie, świętokrzyskie, warmińsko-mazurskie, zachodniopomorskie
III grupa: łódzkie, opolskie, śląskie
IV grupa: lubuskie, małopolskie, pomorskie, wielkopolskie
Teraz, aby lepiej przeanalizować sytuację poziomu zróżnicowania zrównoważonego poziomu rozwoju gospodarczego, przedstawię średnią i odchylenie standardowe dla każdej ze zmiennych w poszczególnych klastrach.
| X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 | X15 | Klaster | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Średnia | 1.857 | 1.918 | 1.718 | 0.803 | 1.802 | 1.109 | 0.020 | 1.222 | 1.281 | 1.147 | 0.160 | -0.188 | 0.968 | -0.726 | -0.274 | 1 |
| Odchylenie st. | 0.969 | 1.143 | 0.716 | 0.076 | 0.873 | 0.556 | 0.784 | 0.508 | 0.855 | 0.254 | 0.404 | 0.127 | 0.091 | 0.602 | 0.775 | 0 |
Klaster 1 – Wysoko rozwinięte regiony
Klaster pierwszy obejmuje województwa o stosunkowo wysokim poziomie rozwoju gospodarczego. Charakteryzują się one wysokim PKB per capita oraz wyższymi niż przeciętnie wynagrodzeniami, co świadczy o dobrym stanie gospodarki i korzystnej sytuacji na rynku pracy. Regiony te mają także wyższy poziom industrializacji, co można wywnioskować z wysokiej produkcji sprzedanej przemysłu na mieszkańca. Niska stopa bezrobocia i dynamiczna przedsiębiorczość sprzyjają stabilności ekonomicznej.
W zakresie społecznym województwa te charakteryzują się lepszą dostępnością opieki zdrowotnej i większą liczbą lekarzy, co może przekładać się na wyższy standard życia. Dobrze rozwinięta edukacja przedszkolna oraz lepsze warunki mieszkaniowe (większa powierzchnia użytkowa na osobę) wskazują na wysoką jakość życia. Niskie zagrożenie ubóstwem skrajnym również świadczy o korzystnej sytuacji społecznej.
Chociaż regiony te mają relatywnie niską emisję zanieczyszczeń, zarówno pyłowych, jak i gazowych, udział obszarów chronionych jest mniejszy niż w innych klastrach. Może to wskazywać na większy nacisk na rozwój gospodarczy kosztem ochrony środowiska. Niemniej jednak, dobra infrastruktura do oczyszczania ścieków pomaga minimalizować negatywny wpływ na środowisko.
| X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 | X15 | Klaster | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Średnia | -0.789 | -0.698 | -0.816 | -0.987 | -0.524 | -0.201 | -0.118 | -0.850 | -0.558 | -0.821 | 0.242 | 0.488 | -0.711 | 0.325 | -0.362 | 2 |
| Odchylenie st. | 0.327 | 0.308 | 0.324 | 0.424 | 0.490 | 0.891 | 0.974 | 0.651 | 1.024 | 0.848 | 0.914 | 0.585 | 0.409 | 1.188 | 1.054 | 0 |
Klaster 2 – Regiony o niższym poziomie rozwoju
Klaster drugi skupia województwa o niższym poziomie rozwoju gospodarczego. Charakteryzuje je niski poziom PKB per capita oraz przeciętne wynagrodzenia, co może świadczyć o problemach gospodarczych i mniejszej atrakcyjności rynku pracy. Stopa bezrobocia jest tutaj stosunkowo wysoka, a dynamika przedsiębiorczości niższa, co ogranicza możliwości wzrostu i rozwoju regionów.
Pod względem społecznym regiony te mają ograniczoną dostępność usług zdrowotnych i edukacyjnych. Mniejsza liczba lekarzy oraz niższa liczba dzieci w placówkach przedszkolnych mogą świadczyć o niedostatecznym poziomie inwestycji w usługi publiczne. Warunki mieszkaniowe również nie należą do najlepszych, a ryzyko ubóstwa skrajnego jest tutaj wyższe niż w pozostałych klastrach, co może wpływać na ogólną jakość życia.
W wymiarze środowiskowym regiony te charakteryzują się wyższymi emisjami zanieczyszczeń pyłowych i gazowych, co może być związane z obecnością przestarzałych technologii przemysłowych. Chociaż udział obszarów chronionych jest większy niż w klastrze 1, infrastruktura środowiskowa, na przykład oczyszczanie ścieków, jest mniej rozwinięta, co negatywnie wpływa na stan środowiska naturalnego.
| X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 | X15 | Klaster | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Średnia | 0.245 | 0.120 | 0.419 | 0.464 | -0.740 | 0.158 | -0.965 | 0.864 | 0.552 | 0.803 | -1.362 | -1.769 | 0.662 | -0.812 | 0.626 | 3 |
| Odchylenie st. | 0.591 | 0.544 | 0.871 | 0.628 | 0.423 | 1.441 | 0.797 | 0.312 | 0.485 | 0.722 | 1.002 | 0.460 | 1.319 | 0.297 | 0.722 | 0 |
Klaster 3 – Regiony o umiarkowanym rozwoju
Klaster trzeci obejmuje województwa o średnim poziomie rozwoju, które charakteryzują się umiarkowanym PKB per capita oraz względnie niską stopą bezrobocia. Wynagrodzenia są nieznacznie wyższe od przeciętnej, co wskazuje na stabilną sytuację na rynku pracy. Choć przedsiębiorczość nie jest tutaj bardzo dynamiczna, regiony te nie mają poważnych problemów gospodarczych.
Pod względem społecznym klaster ten cechuje się niskim obciążeniem demograficznym oraz dobrą dostępnością edukacji przedszkolnej, co pozytywnie wpływa na jakość życia mieszkańców. Warunki mieszkaniowe są lepsze niż przeciętne, co sugeruje wyższy standard życia. Niskie zagrożenie ubóstwem wskazuje na stabilność społeczną.
W zakresie ochrony środowiska regiony te mają niską emisję
zanieczyszczeń zarówno pyłowych, jak i gazowych, co może świadczyć o
stosunkowo czystym środowisku naturalnym. Mimo to udział obszarów
chronionych jest mniejszy, co może wpływać na ograniczone możliwości
ochrony bioróżnorodności. Infrastruktura do oczyszczania ścieków jest
dobrze rozwinięta, co sprzyja ochronie zasobów wodnych.
| X1 | X2 | X3 | X4 | X5 | X6 | X7 | X8 | X9 | X10 | X11 | X12 | X13 | X14 | X15 | Klaster | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| Średnia | 0.268 | 0.173 | 0.254 | 0.978 | 0.571 | -0.321 | 0.921 | 0.228 | -0.078 | 0.261 | 0.517 | 0.567 | 0.264 | 0.404 | 0.302 | 4 |
| Odchylenie st. | 0.574 | 0.729 | 0.577 | 0.423 | 0.598 | 0.921 | 0.615 | 0.711 | 0.607 | 0.104 | 0.488 | 0.182 | 1.080 | 0.723 | 1.166 | 0 |
Klaster 4 – Regiony z problemami społecznymi i
środowiskowymi
Klaster czwarty reprezentuje województwa o umiarkowanym rozwoju gospodarczym, jednak borykające się z wyższą stopą bezrobocia. Mimo przeciętnych wartości PKB per capita i wynagrodzeń, regiony te mają pewne problemy na rynku pracy, co może wpływać na ogólną sytuację ekonomiczną. Z drugiej strony, widoczna jest tutaj większa dynamika przedsiębiorczości, co może stanowić potencjał do przyszłego rozwoju.
Społecznie regiony te mają większe obciążenie demograficzne, co może stanowić wyzwanie dla systemu opieki społecznej. Dostępność opieki zdrowotnej jest mniejsza, a warunki mieszkaniowe nie są tak dobre jak w klastrze 1 lub 3. Mimo to zagrożenie ubóstwem nie jest tutaj wysokie, co wskazuje na umiarkowany poziom stabilności społecznej.
W zakresie środowiskowym województwa te cechują się wyższą emisją zanieczyszczeń oraz umiarkowanym udziałem obszarów chronionych, co może wpływać na stan środowiska naturalnego. Infrastruktura do oczyszczania ścieków jest na poziomie przeciętnym, co sugeruje potrzebę dalszych inwestycji w ochronę środowiska. Wyższe obciążenie demograficzne oraz wyzwania związane z ochroną środowiska mogą stanowić istotne bariery dla zrównoważonego rozwoju w przyszłości.
Podsumowując, klastry te odzwierciedlają zróżnicowane poziomy rozwoju województw w Polsce, zarówno pod względem gospodarczym, społecznym, jak i środowiskowym. Klaster 1 to najbardziej rozwinięte regiony, klaster 2 to obszary o słabszej kondycji gospodarczej, klaster 3 zajmuje pozycję pośrednią, a klaster 4 zmaga się z wyzwaniami społecznymi i środowiskowymi, mimo pewnych pozytywnych aspektów.
Przedstawię teraz za pomocą dendogramów grupowanie hierarchiczne metodą Warda i metodą najdalszego sąsiada, gdyż współczynnik oceniający jakość klasteryzacji tych dwóch metod był najwyższy.
Widzimy, że obydwie te metody bardzo podobnie przydzieliły
województwa do grup. Tylko dwa województwa: podkarpackie i
warmińsko-mazurskie zmieniają swoje miejsca w grupach. Warto również
zwrócić uwagę na fakt, że w przypadku metody Warda, trzecia grupa jest
bardziej liczna w porównaniu do metody najdalszego sąsiada. Może to
świadczyć o tym, że metoda Warda, która minimalizuje sumę kwadratów
odległości wewnątrz klastrów, składa się z bardziej jednorodnych
jednostek. W efekcie, klaster ten zawiera więcej województw, co może
wynikać z różnicy w podejściu obu metod do łączenia klastrów.
W porównaniu z wynikami grupowania podziałowego dostrzegamy pewne różnice. Po pierwsze, województwa takie jak małopolskie, pomorskie i wielkopolskie, które w analizie podziałowej należały do innych klastrów, w hierarchicznym grupowaniu przyłączyły się do regionów o najwyższym poziomie rozwoju. Województwa śląskie, opolskie i łódzkie nadal tworzą odrębną grupę, regionów o umiarkowanym rozwoju. Ciekawym zjawiskiem jest województwo lubuskie, które wcześniej znajdowało się w grupie bardziej rozwiniętych gospodarczo regionów, a obecnie zmieniło swoją przynależność. Pozostałe województwa zachowały te same grupy, co w przypadku grupowania podziałowego.
Celem projektu była ocena poziomu zrównoważonego rozwoju województw w Polsce oraz ich klasyfikacja na podstawie wybranych wskaźników ekonomicznych, społecznych i środowiskowych. Przeprowadzono wielowymiarową analizę danych, która obejmowała zarówno ocenę rankingową, jak i klasyfikację za pomocą metod analizy skupień.
W pierwszym etapie projektu obliczono poziom zrównoważonego rozwoju dla wszystkich województw, stosując różne metody oceny, w tym metodę Hellwiga. Wyniki pokazały zbliżone rankingi województw, z niewielkimi różnicami w pozycjach. Województwo mazowieckie uzyskało najwyższe lokaty w obu rankingach, co sugeruje, że jest najbardziej zrównoważonym regionem w kraju, biorąc pod uwagę wszystkie analizowane wskaźniki. Województwa warmińsko-mazurskie i świętokrzyskie zajęły najniższe pozycje, wskazując na potrzebę intensywniejszych działań na rzecz poprawy ich sytuacji gospodarczej, społecznej i środowiskowej.
Analiza wykazała również, że dla obu zastosowanych metod rankingu, te same siedem województw osiągało wyniki powyżej średniej wartości wskaźnika zrównoważonego rozwoju. Regiony te – dolnośląskie, lubuskie, małopolskie, mazowieckie, pomorskie, śląskie i wielkopolskie – można uznać za wiodące pod względem rozwoju, wykazujące wyższą jakość życia, lepszą sytuację gospodarczą oraz bardziej zrównoważone podejście do ochrony środowiska.
W drugim etapie projektu zastosowano analizę skupień, aby dokonać podziału województw na cztery grupy (klastry) o różnym poziomie zrównoważonego rozwoju. Klaster 1 skupiał regiony o wysokim poziomie rozwoju gospodarczego i jakości życia, lecz z wyzwaniami środowiskowymi. Klaster 2 obejmował województwa o niższym poziomie rozwoju, z wyraźnymi problemami społecznymi i gospodarczymi. Klaster 3 charakteryzował się umiarkowanym rozwojem i stabilną sytuacją, podczas gdy klaster 4 obejmował regiony z wyzwaniami zarówno społecznymi, jak i środowiskowymi.